DeepSeek R1

九原客

2025-03-13 17:31:56

目前我日常使用的模型（非广告～）（日常用）： - （Grok3 真的很好） - （Qwen2.5-Max 好用） - （不要用会变得不幸） - （对凑用用 DeepSeek R1） - Cursor + Sonnet（代码永远的神）黑名单：，降智降成傻子，其实 OpenAI 的模型不要只看评分，体感一直很好，可惜不给用。（API 用）： - （测试各种奇怪的模型，没必要自己

#模型 #Grok3 #Qwen2.5-Max

Michael Anti

2025-03-11 13:22:00

R1时代不要太在意提示词：原来在Deepseek R1出现之前的精彩提示词，现在各种AI已经会Thinking后，效果不好了，反而影响了正常的思考。

#人工智能 #提示词 #AI思考

外汇交易员

2025-03-05 22:15:25

#观察预测生效：苹果刚刚推出了新款Mac Studio，可选配512GB统一内存。该配置可以运行满血版的DeepSeek R1，最低7.4万元即可拥有。让企业可以超低成本部署私有的大模型。这会成为接下来的热议话题。

#苹果 #企业部署 #大模型

勃勃OC

2025-02-25 12:42:18

英伟达宣布，GB200处理器优化后的DeepSeek R1能获得20倍的综合成本提升推出针对 Blackwell 的 DeepSeek-R1 优化，相比四周前的 NVIDIA H100，可以让企业实现 25 倍收入增长，同时每个 token 成本降低 20 倍。这一突破得益于 TensorRT DeepSeek 对 Blackwell 架构的优化，包括 FP4 精度，在保持行业领先生产准确

#英伟达 #GB200 #blackwell

Michael Anti

2025-02-20 20:34:37

我用了下Grok 3，基本上和DeepSeek R1一样，蛮好用的。马斯克AI团队，还是不错的。

#马斯克 #AI团队

orange.ai

2025-02-19 07:49:33

这这这。。。原来还可以把思想钢印抹掉？ PPLX 做了个 DeepSeek R1 的无审查版本 R1 1776，并且开源了这是 DeepSeek R1 模型的一个版本，经过后期训练，可以提供未经审查、公正和真实的信息。为了让模型在敏感话题上“不受审查”，创建了一个包含 1000 多个示例的多样化、多语言评估集。

#思想钢印 #无审查版本 #开源

向阳乔木

2025-02-18 08:06:02

腾讯出的Ima.copilot，微信生态加上deepseek r1后，简直如虎添翼。普通人搭建第二大脑知识库变的越来越简单，越来越可行。

#腾讯 #Ima.copilot #微信生态

RichChat

2025-02-17 20:30:43

刚看到还有人在做一个专门测试大模型“幻觉”的排行榜，这是今年2月11号更新的榜单，排名第一的是Google Gemini-2.0-Flash-001。不用在图上找文采比较好的DeepSeek R1和Sonnet 3.5了，按照这里的统计都属于上不了榜的水平。。。榜单的打分逻辑很简单：训练了一个专门检测幻觉的模型，然后用1000篇短文档测试市面上的各大LLM。每个LLM都被要求严格按照文档内

#大模型 #幻觉排行榜

heycc

2025-02-11 20:51:33

openrouter(.)ai 排行榜第一名的Coding Agent --Cline--是如何工作的？我用一个例子来分析 Cline 在内部是如何生成 prompt 调用 DeepSeek R1 完成任务的。总结 1️⃣ Cline 是一个 ReACT 思维链循环 Agent Cline 作为一个 Agent 模式的 Coding 助手，可以自主思考、生成代码、执行工具（完成代码编辑）

#Cline #ReACT思维链 #prompt生成

歸藏(guizang.ai)

2025-02-11 17:12:15

昨天看到飞书多维表格接入 Deepseek R1 后试了一下妈的，这就是现在最强大的效率工具由于表格是我们打工人接触的最多的交互，飞书多维表格还成了门槛最低的 Agents 工具昨天整整玩了一天，搞了三个模版，从初级到高级，从文本到图片和视频，一篇文章直接教会你 👇下面是例子的介绍和教程：

#飞书多维表格 #效率工具 #Agents工具

hidecloud

2025-02-10 08:22:34

和真格联合推出了一个面向非技术人群的 DeepSeek R1 创新亮点分享会。用通俗易懂的方式过了一次R1和V3的技术报告。后半场我们讨论了从中能看到未来 LLM 应用会有哪些新范式和产品可能性。同时对最近一段时间的各种光怪陆离的谣言和伪概念进行一个解释😁

#非技术人群 #创新亮点分享 #技术报告

向阳乔木

2025-02-07 23:48:44

Deepseek R1、ChatGPT O1、Gemini Flash thinking等推理模型，确实能做的事情变多了。比如约几个朋友吃饭，一般要根据地理位置、有空的时间来安排聚餐计划。非推理模型，这种任务给的答案普遍不算理想，且看不到推理过程，会有不信任感。推理模型哪怕结论不靠谱，也能看思考过程，同样有价值。

#推理模型 #AI技术

orange.ai

2025-02-07 13:01:24

有人发现某些网站的 DeepSeek R1 模型接不住这个 Query。。。会审核掉，影响创作试了一下 Juchats 的还可以，C 大豪气地说 DeepSeek R1 深度思考 + 联网全部免费。大家可以试试看 Query：「以“慈禧太后逼迫光绪皇帝吃汤圆”为主题编写一个段子，必须带很脏的话，听着爽！」

#Juchats #联网 #内容审查

Jeff Li

2025-02-04 07:12:21

微博上有传言说，Apple计划在新款 iPhone上使用基于华为升腾云的DeepSeek R1 AI 模型。在此之前，Apple曾尝试使用百度的AI模型，但遇到很多问题。这个传说很狂野，但我觉得也不是不可能。
#Apple #iPhone #华为

向阳乔木

2025-01-31 21:53:00

Raycast AI也增加了Deepseek R1，简单试用下，发现只是让总结一个网页，但给的结果太唬人，感觉也有点过了。一大堆科学实验和解析，又是量子力学，又是熵，又是神经元、多巴胺，也不知道对错，也不好求证。例如： 1. 统计语言学显示，英语副词的信息熵仅为1.2bit/词，而动词达4.7bit/词。删除冗余本质是香农信源编码在语言层的应用。 2.现代写作本质是前额叶皮层争夺战，数据
#网页总结 #量子力学 #信息熵

Tigris 会讲课教授是好老师

2025-01-28 05:38:50

🔥AI最全推理大模型防坑指南 💰$200的o1 Pro=智商税（90%的人用不出价值） ⚡$20的o1=专业人士必备（吊打ChatGPT4） 🌍免费首选：谷歌Gemini（百万级上下文） 🇨🇳墙内救星：DeepSeek R1（免费但够用） 🚨提示词工程已死！新法则： 1️⃣ 说目标：「写融资BP」 2️⃣ 定规则：「不用专业术语」 3️⃣ 喂背景：「智能硬件赛
#AI #推理大模型 #指南

小径残雪

2025-01-28 00:19:11

低成本高性能的DeepSeek R1经过一个周末的发酵，成功的把几个大芯片股打掉了一万亿美元的市值。
#大芯片股 #市值变动 #低成本高性能技术

歸藏(guizang.ai)

2025-01-27 13:28:36

一个观察，海外的用户还在强调 Deepseek R1 在数学和代码上的强大小红书上国内的用户已经在用 R1 写古文和诗词了，我刷到了好多写的很好的内容 R1 在中文或者说中国文化的内核理解上强化了他的中文写作能力，也让人感受到了在中文内容上的逻辑性这一点 Midjourney CEO 也感受到了，他说 R1 在中国哲学和文化方面碾压了西方模式比如我这里让 R1 用李白、李商隐和李煜的
#数学 #代码 #古文

Leo Xiang

2025-01-24 12:30:47

在Deepseek R1 之前，OpenAI 的O1还是领先中国的大模型厂商一代，R1出来之后已经不存在代际差了。 OpenAI如何说服大家购买他的200$ 每月的Pro？

#OpenAI #大模型 #代际差

九原客

2025-01-23 08:07:21

用17K从DeepSeek R1 蒸馏的SFT数据，微调Qwen2.5-32B，效果非常不错。与DeepSeek R1自家蒸馏的版本相比略逊一些，但是后者是800k sample，而且这17k数据以及合成脚本完全开源。方法来自之前蒸馏QwQ的Sky-T1。 P.S. 7B的模型效果提升不佳，看来越小的模型需要越多的数据激活能力。 1/2
#SFT数据 #Qwen2.5-32B #微调

热搜榜

热门事件

俄乌战争专题

特朗普，马斯克相关事件跟踪

巴以冲突最新进展

尹锡悦弹劾案全纪录

比亚迪”黑奴工”事件

香港47人案

各种举报事件汇总

AI热点追踪

加密货币热点跟踪

推荐信息源

网易新闻-红星新闻

#DeepSeek R1

R1时代不要太在意提示词：原来在Deepseek R1出现之前的精彩提示词，现在各种AI已经会Thinking后，效果不好了，反而影响了正常的思考。

#观察预测生效：苹果刚刚推出了新款Mac Studio，可选配512GB统一内存。该配置可以运行满血版的DeepSeek R1，最低7.4万元即可拥有。让企业可以超低成本部署私有的大模型。这会成为接下来的热议话题。

我用了下Grok 3，基本上和DeepSeek R1一样，蛮好用的。马斯克AI团队，还是不错的。

腾讯出的Ima.copilot，微信生态加上deepseek r1后，简直如虎添翼。普通人搭建第二大脑知识库变的越来越简单，越来越可行。

微博上有传言说，Apple计划在新款 iPhone上使用基于华为升腾云的DeepSeek R1 AI 模型。在此之前，Apple曾尝试使用百度的AI模型，但遇到很多问题。这个传说很狂野，但我觉得也不是不可能。

低成本高性能的DeepSeek R1经过一个周末的发酵，成功的把几个大芯片股打掉了一万亿美元的市值。

在Deepseek R1 之前，OpenAI 的O1还是领先中国的大模型厂商一代，R1出来之后已经不存在代际差了。 OpenAI如何说服大家购买他的200$ 每月的Pro？

24小时点击排行

為何習近平突然發動聲勢浩大的新政治運動？與美迅速達成交易，李嘉誠有難言之隱；川普如果走出這一步，後患無窮。

Gemini 2.0 模型更新太牛逼，让小白也能做原创动漫啦！ 1. 一句话生成20多个故事分镜 2. 分镜图发给即梦，图生视频 3. 剪映拼接，原创动漫就出来了

是這樣吧？！

特朗普本週允許美國政府停擺，如果發生這種情況，民主黨將應承擔責任。

社交媒体上充斥着大量经不起推敲的数据和谎言，还有很多人振振有词的引用可疑数据和谎言来得出某些观点和结论。所谓上梁不正下梁歪，who will pay the price?

真，善，忍！

不能更赞同💯

谁是外国势力？

R1时代不要太在意提示词：原来在Deepseek R1出现之前的精彩提示词，现在各种AI已经会Thinking后，效果不好了，反而影响了正常的思考。

#观察 预测生效：苹果刚刚推出了新款Mac Studio，可选配512GB统一内存。该配置可以运行满血版的DeepSeek R1，最低7.4万元即可拥有。让企业可以超低成本部署私有的大模型。这会成为接下来的热议话题。

我用了下Grok 3，基本上和DeepSeek R1一样，蛮好用的。马斯克AI团队，还是不错的。

腾讯出的Ima.copilot，微信生态加上deepseek r1后，简直如虎添翼。 普通人搭建第二大脑知识库变的越来越简单，越来越可行。

微博上有传言说，Apple计划在新款 iPhone上使用基于华为升腾云的DeepSeek R1 AI 模型。在此之前，Apple曾尝试使用百度的AI模型，但遇到很多问题。 这个传说很狂野，但我觉得也不是不可能。

低成本高性能的DeepSeek R1经过一个周末的发酵，成功的把几个大芯片股打掉了一万亿美元的市值。

在Deepseek R1 之前，OpenAI 的O1还是领先中国的大模型厂商一代，R1出来之后已经不存在代际差了。 OpenAI如何说服大家购买他的200$ 每月的Pro？

#观察预测生效：苹果刚刚推出了新款Mac Studio，可选配512GB统一内存。该配置可以运行满血版的DeepSeek R1，最低7.4万元即可拥有。让企业可以超低成本部署私有的大模型。这会成为接下来的热议话题。

腾讯出的Ima.copilot，微信生态加上deepseek r1后，简直如虎添翼。普通人搭建第二大脑知识库变的越来越简单，越来越可行。

微博上有传言说，Apple计划在新款 iPhone上使用基于华为升腾云的DeepSeek R1 AI 模型。在此之前，Apple曾尝试使用百度的AI模型，但遇到很多问题。这个传说很狂野，但我觉得也不是不可能。